Model Selection

RoBERTa Text Encoding

# RoBERTa Text Encoding

Taiyi CLIP RoBERTa 326M ViT H Chinese

The first open-source Chinese CLIP model, pre-trained on 123 million image-text pairs, with RoBERTa-large architecture as the text encoder.

Transformers Chinese

Taiyi CLIP Roberta Large 326M Chinese

The first open-source Chinese CLIP model, pre-trained on 123 million image-text pairs, supporting Chinese image-text feature extraction and zero-shot classification

Transformers Chinese

Taiyi CLIP Roberta 102M Chinese

The first open-source Chinese CLIP model, pre-trained on 123 million image-text pairs, with a text encoder based on RoBERTa-base architecture.

Transformers Chinese

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase